ارائۀ راهکاری قاعده مند جهت تبدیل خودکار درخت تجزیۀ نحوی وابستگی به درخت تجزیۀ نحوی ساخت سازه ای برای زبان فارسی

Authors

فاطمه سلطان زاده

fatemeh soltanzadeh tehran, sharif university of technology, languages and linguistics centerتهران، دانشگاه صنعتی شریف، مرکز زبانها و زبان شناسی محمد بحرانی

mohammad bahrani tehran, sharif university of technology, languages and linguistics centerتهران، دانشگاه صنعتی شریف، مرکز زبانها و زبان شناسی محرم اسلامی

moharram eslami zanjan, university of zanjan, faculty of humanitiesزنجان، دانشگاه زنجان، دانشکده علوم انسانی

abstract

هدف مقاله حاضر ارائۀ روشی خودکار جهت تبدیل درخت تجزیه نحوی وابستگی به درخت تجزیه نحوی مبتنی بر دستور ساخت سازه ای معادل در زبان فارسی است. برای نیل بدین هدف، الگوریتمی قاعده مند جهت این نوع تبدیل طراحی شده است. به منظور دستیابی به درخت تجزیۀ نحوی ساخت سازه ای مناسب برای جملات زبان فارسی، دستور زبان فارسی مورد مطالعه قرار گرفته و قوانین خاص زبان فارسی استخراج و به الگوریتم مذکور افزوده شده است. نتایج حاصل از ارزیابی پژوهش بیانگر این است که الگوریتم طراحی شده برای تبدیل ساختارها به f1 معادل با 96.05 درصد دست یافته است. سپس، الگوریتم مذکور بر روی پیکرۀ وابستگی زبان فارسی با حدود 30000 جمله اعمال و دادگان درخت نحوی ساخت سازه ای معادل حاصل شده است. علاوه بر این، تجزیه گر نحوی استنفورد برروی پیکرۀ ساخت سازه ای حاصل آموزش داده شده و تجزیه گر نحوی ترکیبی زبان فارسی با f1 معادل با 86.01 درصد به دست آمده است.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

ارائۀ راهکاری قاعده‌مند جهت تبدیل خودکار درخت تجزیۀ نحوی وابستگی به درخت تجزیۀ نحوی ساخت‌سازه‌ای برای زبان فارسی

In this paper, an automatic method in converting a dependency parse tree into an equivalent phrase structure one, is introduced for the Persian language. In first step, a rule-based algorithm was designed. Then, Persian specific dependency-to-phrase structure conversion rules merged to the algorithm. Subsequently, the Persian dependency treebank with about 30,000 sentences was used as an input ...

full text

تولید درخت بانک سازه‌ای زبان فارسی به روش تبدیل خودکار

Treebanks is one of important and useful resource in Natural Language Processing tasks. Dependency and phrase structures are two famous kinds of treebanks. There have already made many efforts to convert dependency structure to phrase structure. In this paper we study an approach to convert dependency structure to phrase structure because of lack of a big phrase structure Treebank in Persian. A...

full text

تولید درخت بانک سازه ای زبان فارسی به روش تبدیل خودکار

درخت بانک از مهم­ترین و پرکاربردترین منابع مورد استفاده در زمینه پردازش زبان طبیعی است. دو نوع از پرکاربردترین درخت بانک­ ها، درخت بانک وابستگی و درخت بانک سازه­ ای است. با توجه به نبود درخت بانک سازه ­ای با حجم بزرگ در زبان فارسی در این مقاله به بررسی روشی ارائه شده در تبدیل درخت بانک وابستگی به سازه ­ای می­ پردازیم. سپس مشکلات این روش را در زبان فارسی و انگلیسی بررسی و با ارائه راهکارهایی کیف...

full text

میزان وابستگی نحوی و معنایی بندهای متممی در زبان فارسی

وابستگی از مهم‌ترین روابط بین عناصر نحوی است. در وابسته‌سازی، واحدی به واحد دیگری وابسته می‌شود. یکی از انواع ساخت‌های وابسته، بند متممی است. در این پژوهش به بررسی میزان وابستگی نحوی و معنایی بندهای متممی زبان فارسی می‌پردازیم. افعال متممی فارسی را براساس عوامل معنایی ازجمله احتمال انجام فعل بند اصلی، هم‌ارجاعی و هم‌زمانی بین بند متممی و بند اصلی، در طبقات متفاوت وابستگی قرار داده‌ایم. سپس، با ...

full text

ساخت نحوی بدل و بند موصولی توضیحی در زبان فارسی

تفاوت رفتار نحوی‌ای که بندهای موصولی و بدل فارسی براساس خوانش معناییِ خود در هر جمله نشان می‌دهند، توجیه نحوی دارد. به بیانی دیگر، این تفاوت ناشی از محل استقرار فرافکنِ متمم‌نما و گروه حرف تعریف در میان سایر فرافکن‌های نقشی جمله است. در این پژوهش بند موصولی، به صورت افزوده، و بدل‌ها، به صورت افزودگی یا همپایگی، ترسیم می‌شوند. در حالی که با ترسیم افزودگی به‌جای افزوده، نمودارهای بند موصولی و بدل ی...

full text

تصحیح خودکار خطا در درخت بانک نحوی با استفاده از یادگیری ماشینی انتقال محور

The Treebank is one of the most useful resources for supervised or semi-supervised learning in many NLP tasks such as speech recognition, spoken language systems, parsing and machine translation. Treebank can be developded in different ways that could be, generally, categorized in manually and statistical approaches. While the resulted Treebank in each of these methods has the annotation error,...

full text

My Resources

Save resource for easier access later


Journal title:
پردازش علائم و داده ها

جلد ۱۲، شماره ۴، صفحات ۹۵-۱۱۵

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023